1 การว เคราะห ข อม ลด วย โปรแกรม SPSS (Statistics Package for the Social Sciences) 1. หน าต างของ SPSS 1.1 Data Editor เป ดโปรแกรม Start > program > SPSS > SPSS for window หน าต าง Data Editor ของ SPSS ม 2 ส วน ด งน Data View ค อ หน าต างท จะท าการ Key ข อม ลลงไป Variable View ค อ หน าต างท ท าการก าหนดช อ ล กษณะของต วแปรแต ละต ว เม อเข ามาท หน าจอ SPSS แล ว ให ไปท Variable View จะได ด งร ป หน าต าง Variable View เป นหน าต างส าหร บการก าหนดช อ และชน ด ล กษณะของต วแปรแต ละต ว โดยแต ละ column ใน หน าต างน จะเป นช อและล กษณะต างๆ ของต วแปรแต ละต ว (ต วแปรแต ละต วจะปรากฏในแต ละแถว เช น แถวท 1 ค อ ช อและ ข อม ลของต วแปรต วท 1) 1. Name* ค อ ช อของต วแปรหร อส ญล กษณ แทนต วแปรน น ๆ ความยาวไม เก น 7-10 ต วอ กษร (ข นอย ก บ version) โดยช อน จะไปปรากฎเป นช อ column ในหน าต าง Data View เช น ID SEX AGE EDU SAT 2. Type* ค อ ชน ดของต วแปร ท ส าค ญ ค อ Numeric เป น ข อม ลท เป นต วเลข,String เป น ข อม ลท เป น ต วอ กษร
2 3. Width ค อ ความกว างของต วแปรหร อจ านวนอ กขระหร ออ กษรท ต องการให ใส ได ใน Values 4. Decimals ค อ จ านวนทศน ยม 5. Labels ค อ ค าอธ บายต วแปรหร อช อเต มของต วแปรน น ๆ จะใช ในกรณ ท ผ ว จ ยก าหนดช อต วแปรใน column Name เป นอ กษรย อ แล วต องการอธ บายหร อขยายความไว เช น Name ระบ เป น ID ใน Labels จะระบ เป น ล าด บท หร อ Name ระบ เป น Salary ใน Labels จะระบ เป น รายได ต อเด อน เป นต น 6. Values* ค อ เป นการก าหนดค าให ก บต วแปร เช น ต วแปร เพศ ก าหนดให เพศชาย ม ค าเท าก บ 1 และ เพศ หญ ง ม ค าเท าก บ 2 เป นต น โดย ค าของต วแปร เช น 1 น นจะใส ในช อง Value ส วนช อของค าต วแปรน น เช น เพศชาย จะใส ในช อง Value Label 7. Missing ค อ ค าของข อม ลท แสดงว าผ ตอบแบบสอบถามไม ได ตอบในข อค าถามข อน น เช น ต วแปร เพศ ก าหนดค า missing = 9 น นค อ ถ าม ผ ท ไม ระบ เพศในแบบสอบถาม จะ key ข อม ลเป น 9 โดยท วไปจะ ก าหนดค า missing ให ไม ซ าก บค าของต วแปร Values 8. Column เป นการก าหนดความกว าง ของ Column ซ งส วนใหญ จะก าหนดให กว างกว าความกว างของต วแปร 9. Align เป นต วก าหนดล กษณะการวางข อม ลว าจะให อย ช ดซ าย กลาง ขวา 10. Measure เป นต วท จะบ งบอกว าข อม ลน นเป นข อม ลแบบใด Scale, Ordinal หร อ Nominal * ข อม ลท จ าเป นต องระบ ท กคร งในการสร างแฟ มข อม ล ต วอย างการก าหนดล กษณะต วแปรในหน าต าง Variable view Data view
3 1.2 Output เป นหน าต างแสดงผลล พธ การประมวลผล 2. การลงรห สในแฟ มข อม ล การ key ข อม ลจะใช หน าต าง Data view เป นหล ก ข อม ลในแต ละแถว หมายถ ง ข อม ล 1 ช ด เช น แถวท 1,2,3, n เป นข อม ลของผ ตอบคนท 1,2,3, n ตามล าด บ ข อม ลในแต ละ column หมายถ ง ข อม ลของต วแปรแต ละต ว หร อ ข อค าถามแต ละข อ ว ธ การ key ให ใส รห สตามค าท เราก าหนดไว เช น ต วแปร เพศ 1 = เพศชาย, 2 = เพศหญ ง และ 9 =ไม ตอบ ด งน นเวลา Key ข อม ลเพศ ก จะ Key หมายเลข 1 หร อ 2 หร อ 9 เท าน น ในกรณ ของ salary ให ใส ต วเลขตามท ผ ตอบแบบสอบถามระบ ได เลย ด งต วอย าง
4 3. การเปล ยนแปลง หร อปร บแก ข อม ล 3.1 การเปล ยนค าต วแปร (RECODE) การเปล ยนค าของข อม ลส าหร บต วแปรใดๆ โดยอาจจะเป นการเปล ยนค าใดๆ ค าหน ง เป นค าใหม หร อ เปล ยนจากค าท ต อเน องก นเป นค าเด ยว สามารถท าได 2 ล กษณะ ค อ 1) การเปล ยนค าในต วแปรเด ม (Transform>Recode>Into Same Variables ) 2) การเปล ยนค าและสร างเป นต วแปรใหม (Transform>Recode>Into Different Variables ) 1) การเปล ยนค าในต วแปรเด ม (Transform>Recode>Into Same Variables ) 1 2 1. เล อก ต วแปร ท ต องการเปล ยนค าจากช องหมายเลข 1 มาท ช อง 2 หร อ Numeric Variable: 2. เล อกค าส ง Old and New Values จะปรากฏด งร ปขวาม อ (ภาพประกอบ) 3. ก าหนดค าท ต องการเปล ยนในส วน Old Value และก าหนดค าใหม ท ต องการแทนค าเด มในส วน New Value หล งจากน นเล อก Add จะปรากฎค าท เปล ยนในช อง Old => New 4. เล อกป ม Continue จะกล บมาแสดงหน าจอ Recode into Same Variables (หน าจอซ ายม อ) ถ าต องการเปล ยน ค าของข อม ลบางช ดให กด If เพ อก าหนดเง อนไขในการเล อกช ดข อม ลท จะน ามาเปล ยนค า 5. เล อก OK ค าของต วแปรท ถ กเล อกจะเปล ยนเป นค าใหม ท นท
5 2) การเปล ยนค าและสร างเป นต วแปรใหม (Transform>Recode>Into Different Variables ) 1. เล อกต วแปรท ต องการเปล ยนค าจากกล องซ ายม อ มาไว ท ช อง Numeric Variable => Output 2. ต งช อต วแปรใหม ท ช อง Output Variable ท ช อง Name: หล งจากน นเล อกป ม Old and New Values โดยให ด าเน นการเช นเด ยวก บการเปล ยนค าในต วแปรเด ม (Into Same Variable) 3.2 การสร างต วแปรใหม จากการค านวณและเง อนไข (Compute) เป นการสร างต วแปรใหม ด วนการค านวณทางคณ ตศาสตร ม ข นตอนด งน 1. เล อก Transform > Compute จะปรากฏหน าจอด งน 2. สร างช อต วแปรใหม ในกล อง Target Variable และก าหนดการค านวณในกล อง Numeric Expression เช น a1+a2+a3 3. คล กท ป ม Continue และ OK ตามล าด บ
6 4. การเล อกว เคราะห บางกล มข อม ล 4.1 การว เคราะห แยกตามค าของต วแปร (Split File Processing) ใช เม อต องการแยกว เคราะห ข อม ลเป นกล ม ๆ ตามค าของต วแปรใด ต วแปรหน ง หร อมากกว า 1 ต วแปร เช น ต องการแ ยกว เคราะห ระด บความพ งพอใจ ตามกล ม เพศ อาช พ หร อ ระด บการศ กษา เป นต น ค าส ง Data > Split File Analyze all cases, do not create groups ว เคราะห ข อม ลท ก case Compare groups ใช เม อต องการให ว เคราะห ข อม ลแยกเป นกล ม ๆ ตามต วแปร เช น ว เคราะห ค าเฉล ย แยกตามเพศ แยกตามอาย (ต องเป นต วแปรในระด บ nominal scale)
7 Organize output by groups ให ผลการว เคราะห เหม อน Compare groups แต แยกตารางตามกล ม ต วอย าง output กรณ เล อก Compare groups 4.2 การว เคราะห เฉพาะบางส วนของข อม ล (Select cases) ใช เม อต องการว เคราะห เพ ยงบางส วนของข อม ล เช น หา รายได เฉล ย เฉพาะของ เพศชาย หร อเฉพาะของ ผ ท ม อาย 30 ป ข นไป เป นต น ค าส ง Data > Select Cases
8 All case เล อกท ก case If condition is satisfied ก าหนดเง อนไขให ว เคราะห ข อม ลเฉพาะบางกล ม เช น ต องการว เคราะห เฉพาะเพศชาย, ม อาย 30 ป ข นไป Random sample of cases ต องการเล อกต วอย าง case แบบส มจากจ านวนท งหมด โดยระบ เป นเปอร เซนต Based on time or case range ต องการว เคราะห เฉพาะบาง case ท ก าหนด เช น ว เคราะห เฉพาะ caseท 1-30
9 ต วอย าง ผลของค าส งท ให ว เคราะห เฉพาะเพศชาย, ม อาย 30 ป ข นไป 5. การประมวลผลสถ ต เช งพรรณาใน SPSS กรณ ข อม ล nominal และ ordinal SPSS: Analyze > Descriptive Statistics > Frequencies เล อกท Statistics จะม ค าสถ ต พ นฐานให เล อกด งน
10 N Median Mode Range Minimum Maximum Percentiles Valid Missing 25 50 75 Statistics Household Years at income in current thousands address 6400 6400 0 0 45.0000 9.00 25.00 0 1107.00 56 9.00 0 1116.00 56 28.0000 3.00 45.0000 9.00 79.0000 17.00 ก รณ ข อม ล interval และ ratio 1. SPSS: Analyze > Descriptive Statistics > Descriptives Descriptive Statistics N Minimum Maximum Mean Std. Deviation Job satisfaction 6400 1 5 3.06 1.369 Valid N (listwise) 6400
11 2. SPSS: Analyze > Compare means > Means เล อกท Options ผ ว จ ยสามารถเล อกสถ ต ท ต องการให ประมวลผลได Report Job satisfaction Years with current employer Mean N Std. Deviation Less than 5 2.22 2216 1.209 5 to 15 3.20 2364 1.240 More than 15 3.90 1820 1.107 Total 3.06 6400 1.369
12 6. ว ธ การตรวจสอบการแจกแจงของข อม ล ได แก ตาราง กราฟ และ สถ ต ทดสอบ 1) ตาราง ในการน าเสนอกา รแจกแจงข อม ลด วยความถ ร อยละ สามารถใช น าเสนอได ในร ปแบบด วน ตารางทางเด ยว SPSS: Analyze > Descriptive Statistics > Frequencies Job satisfaction Valid Cumulative Frequency Percent Percent Percent Valid Highly dissatisfied 1064 16.6 17.3 17.3 Somewhat dissatisfied 1210 18.9 19.7 37.0 Neutral 1343 21.0 21.8 58.8 Somewhat satisfied 1354 21.2 22.0 80.8 Highly satisfied 1180 18.4 19.2 100.0 Total 6151 96.1 100.0 Missing System 249 3.9 Total 6400 100.0 ตารางแบบหลายทาง SPSS: Analyze > Descriptive Statistics > Crosstabs ตาราง 2 ทางให เล อกต วแปรเฉพาะ row(s): และ column(s): ตาราง 3 ทางให เล อกต วแปรเพ มลงในช อง Layer กรณ ท ต องการให ค านวณร อยละ ให เล อกท Percentages
13 Level of education * Job satisfaction * Retired Crosstabulation Retired No Yes Level of education Total Level of education Total Did not complete high school High school degree Some college College degree Post-undergraduate degree Did not complete high school High school degree Some college College degree Post-undergraduate degree Job satisfaction Highly Somewhat Somewhat Highly dissatisfied dissatisfied Neutral satisfied satisfied Total 163 227 270 345 292 1297 15.0% 18.7% 20.3% 25.9% 25.6% 21.3% 296 362 402 399 376 1835 27.3% 29.9% 30.3% 30.0% 33.0% 30.1% 273 253 302 260 220 1308 25.2% 20.9% 22.8% 19.5% 19.3% 21.5% 273 303 275 262 192 1305 25.2% 25.0% 20.7% 19.7% 16.9% 21.4% 80 66 78 64 59 347 7.4% 5.5% 5.9% 4.8% 5.2% 5.7% 1085 1211 1327 1330 1139 6092 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 4 21 21 16 31 93 16.7% 36.8% 31.8% 21.1% 36.5% 30.2% 8 13 24 29 27 101 33.3% 22.8% 36.4% 38.2% 31.8% 32.8% 3 9 10 13 17 52 12.5% 15.8% 15.2% 17.1% 20.0% 16.9% 7 12 8 13 10 50 29.2% 21.1% 12.1% 17.1% 11.8% 16.2% 2 2 3 5 0 12 8.3% 3.5% 4.5% 6.6%.0% 3.9% 24 57 66 76 85 308 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% ตารางส าหร บข อม ลท ตอบได มากกว า 1 ข อ ใช ในกรณ ท เป นค าถามท ผ ตอบสามารถตอบได หลายค าตอบ ต วอย าง ป จจ บ นท านม อ ปกรณ ไฟฟ าอะไรบ าง (ตอบได มากกว า 1 ข อ) โทรท ศน เคร องเล น CD PDA คอมพ วเตอร เคร อง FAX ข นท 1 การสร าง set ต วแปร (Define Multiple Response Sets) ท าได โดยการรวมค าตอบของค าถามเด ยวก นให อย ใน set เด ยวก นโดย 1 set ค อ 1 ค าถามSPSS: Analysis > Multiple Response > Define Sets - เล อกต วแปรในช ดค าถามเด ยวก น ใส ใน Variables in Sets - ในส วน Variables Are Coded As เล อก Dichotomies แล วใส ค า Coded value เป น 1 - ต งช อต วแปรของกล มค าตอบน ใน Name: (ต วอย างค อ own) และอธ บายช อต วแปรใน Label: (ต วอย าง เคร องใช ไฟฟ า) - คล ก Add จะปรากฎช อ set เป น $own ใน Multi Response Sets - คล ก Close
14 ข นท 2 การว เคราะห ต วแปรใน set ต วแปร 1. Frequencies เป นการแสดงจ านวนและร อยละของแต ละค าตอบ 2. Crosstabs เป นการแสดงจ านวนและร อยละในร ปตารางแบบ 2 ทางข นไป 1. Frequencies เป นการแสดงจ านวนและร อยละของแต ละค าตอบ SPSS: Analysis > Multiple Response > Frequencies - เล อกต วแปรใน Mult Response Sets ลงใน Table(s) for: - Missing Values เล อก Exclude cases listwise within dic - เล อก OK hotomies
15 1 3 4 2 หมายเลข 1 ค อ จ านวนการตอบ (17863 ค าตอบ) หมายเลข 2 ค อ จ านวนผ ตอบแบบสอบถาม (6377 คน) หมายเลข 3 ค อ ร อยละของการตอบ โดยค ดจากจ านวนการตอบ 17863 ค าตอบ หมายเลข 4 ค อ ร อยละของผ ตอบ โดยค ดจากจ านวนผ ตอบ 6377 คน 2. Crosst abs เป นการแสดงจ านวนและร อยละในร ปตารางแบบ 2 ทางข นไป SPSS: Analysis > Multiple Response > Crosstabs ต วอย าง ต องการหาจ านวนการครอบครองเคร องใช ไฟฟ า แยกตามระด บการศ กษา (ตาราง 2 ทาง) - เล อกต วแปรท ต งไว ($own) และต วแปรระด บการศ กษา (ed) ลงใน row และ column - เล อก Define Ranges จะปรากฎ หน าต างของ Multiple Response Crosstabs: Define Variable Ranges ให ก าหนดค ารห สต าส ด (1) และส งส ด (4) ของต วแปร ed - Options
16 สามารถเล อกการค านวณร อยละได ใน Cell Percentages Percentages Based on เป นการเล อกว าจะค านวณร อยละจากจ านวน case (จ านวนผ ตอบ) หร อจ านวน response (จ านวนการตอบ) Missing Values เล อก Exclude cases listwise within dichotomies 2. กราฟ ผ ว จ ยสามารถเล อกชน ดของกราฟเพ อแสดงข อม ลได หลากหลายท ง กราฟแท ง กราฟเส น แผนภ ม วงกลม ฯลฯ โดย ในโปรแกรม SPSS สามารถเล อกใช ค าส ง Graphs Histogram แกนนอนแสดงค าต วแปร (ข อม ล) โดยแบ งค าข อม ลออกเป นช วงๆ แต ละช วงจะม ข อม ลเท าก น ส วนแกน ต งแสดงจ านวน case หร อความถ ท ม ค าในแต ละช วงของแต ละช วง หร ออาจจะเล อกให แกนต งแสดงร อยละก ได ค าส ง SPSS: 1. Analyze > Descriptive Statistics > Frequencies เล อกท ค าส ง Charts 2. Analyze > Descriptive Statistics > Explore เล อกค าส ง Plots
17 3. Graphs > Histogram 1600 1400 Histogram 1200 1000 800 600 uency Freq 400 200 0 1.0 2.0 3.0 4.0 5.0 Std. Dev = 1.37 Mean = 3.1 N = 6400.00 Job satisfaction
18 Boxplot เป นเทคน คท ม ความละเอ ยดเก ยวก บการแจกแจงข อม ล ม การ plot ค าม ธยฐาน เปอร เซ นต ไทล ท 25,75 และ แสดงค าท ผ ดปกต น นค อค าท ส งมากหร อต ามาก(outlier)จากค ากลาง การสร าง Boxplot จะให ค าสถ ต 5 ค า ด วยก นค อ 1. ค าต าส ดของข อม ลท ย งไม ต าผ ดปกต : ค าไม เก น Q1-1.5IQR 2. ค าต าส ด: ควอไทล ท 1 (Q1) = เปอร เซ นไทล ท 25 ของข อม ล 3. ค ากลาง: ควอไทล ท 2 (Q2) = เปอร เซ นไทล ท 50 = ค าม ธยฐาน 4. ค าส งส ด: ควอไทล ท 3 (Q3) = เปอร เซ นไทล ท 75 ของข อม ล 5. ค าส งส ดของข อม ลท ย งไม ส งผ ดปกต : ค าไม เก น Q1+1.5IQR ความกว าง box = Q3 - Q1 เร ยกว า interquartile range(iqr) น นค อ 50%ของข อม ลอย ใน box box plot จะแสดงค าผ ดปกต 2 ล กษณะ 1. ค า extreme เป นค าของข อม ลท ม ค ามากกว า 3 เท า ของความกว างของ box (ข อม ลท ม ค ามากกว า Q3+3(IQR) หร อ น อยกว า Q3-3(IQR) 2. ค า outliner เป นค าของข อม ลท อย ระหว าง 1.5 ถ ง 3 เท าของความกว าง box (อย ระหว าง Q3+1.5IQR ถ ง Q3+3IQR และ อย ระหว าง Q3-1.5IQR ถ ง Q3-3IQR) IQR * O extreme: ค าท มากกว า Q3 + 3(IQR) outliner: ค าท อย ระหว าง Q3+1.5(IQR) ถ ง Q3 + 3(IQR) ค าส งส ดของข อม ลท ย งไม ส งผ ดปกต (5) ค าส งส ด: ควอไทล ท 3(Q3) = เปอร เซ นไทล ท 75 ของข อม ล (4) ค ากลาง: ควอไทล ท 2 (Q2) = เปอร เซ นไทล ท 50 = ค าม ธยฐาน (3) O * ค าต าส ด: ควอไทล ท 1(Q1) = เปอร เซ นไทล ท 25 ของข อม ล (2) ค าต าส ดของข อม ลท ย งไม ต าผ ดปกต (1) outliner: ค าท อย ระหว าง Q3-1.5(IQR) ถ ง Q3-3(IQR) extreme: ค าท น อยกว า Q3-3(IQR) ความหมายของ Boxplot การว ดค ากลางของข อม ล จะพ จารณาจากค าม ธยฐาน ถ าค าม ธยฐานอย ตรงกลางของ box แสดงว าการแจกแจงของข อม ล ม การแจกแจงแบบปกต การว ดการกระจายของข อม ล จะพ จารณาจากความกว างของ box - ถ าความกว างของ box มาก แสดงว าข อม ลม การกระจายมาก - ถ าความกว างของ box น อย แสดงว าข อม ลม การกระจายน อย
19 ค าส ง SPSS: 1. Analyze > Descriptive Statistics > Explore Dependent List: ต วแปรท ต องการตรวจสอบและต องเป นต วแปรเช งปร มาณ (interval/ratio) Factor List : เป นต วแปรท ใช ในการแบ งกล มข อม ล (nominal) เช น เพศ ระด บการศ กษา อาช พ 2. Graphs > Boxplot เล อกกราฟแบบ simple และ define.
20 6 5 4 3 2 Job satisfaction 1 0 N = 2216 Less than 5 2364 5 to 15 1820 More than 15 Years with current employer 3. สถ ต ทดสอบการแจกแจงข อม ล เป นการทดสอบการแจกแจงของข อม ลว าเป นการแจกแจงแบบปกต หร อใกล เค ยงหร อไม ด วยส ตรของ Kolmogorov Smirnov และ Shapiro Wilk ถ าผลการทดสอบไม ม น ยส าค ญ (ค า sig. <.05)แสดงว า ข อม ลม การแจกแจงแบบปกต หร อใกล เค ยง ค าส ง SPSS: Analyze > Descriptive Statistics > Explore ท ค าส ง Plots เล อก Normality plots with tests
21 Tests of Normality Level of education Job satisfaction Did not complete high school High school degree Some college College degree Post-undergraduate degree a. Lilliefors Significance Correction Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig..192 1390.000.892 1390.000.168 1936.000.896 1936.000.152 1360.000.895 1360.000.175 1355.000.896 1355.000.153 359.000.890 359.000
22 แบบสอบถามการท างาน ข อม ลส วนบ คคล 1 เพศ [ ] ชาย [ ] หญ ง 2 อาย... ป 3 อาช พ [ ] ว ศวกร [ ] แพทย [ ] น กข าว 4 รายได (ต อเด อน)... บาท 0Bความร ส กต องานท ท านท า 1 ความน าสนใจของงานท ร บผ ดชอบ 2 ท านม เพ อนร วมงานท ด 3 ท านม นใจในความม นคงของหน วยงาน มาก ท ส ด มาก ปาน กลาง น อย น อย ท ส ด คะแนนความสามารถทางคอมพ วเตอร (100 คะแนน) ก อนการฝ กอบรม...คะแนน หล งการฝ กอบรม...คะแนน